哈囉大家好~~~~
上一篇我們說完SVM,今天我要介紹隨機森林,在回答複雜的問題時,許多人的回應中找到複雜問題的答案,往往能比一個人的回答,更好地回答複雜問題,這就是所謂的人群的智慧,如果把這個方法用於機器學習就是隨機森林,前面我們有提過所謂的決策樹,今天我們將決策樹集合起來變成隨機森林,我們的做法不是採用整個訓練集建立一個決策樹,而是將訓練集的以隨機子樣本的方式分配給每個決策樹,所有樹木都在訓練集的數據子集上進行了訓練,這樣將許多預測的結果,通常整合多個數木的結果會比單個模型表現更好,但是,我們也不是無限地增加樹木,避免過度擬合(overfitting)我們的訓練數據。
計算能力飛躍的進步和大量的數據讓神經網絡的表現越來越好,因此,下一篇我們要回來談談現代的神經網絡。
那麼大家我們明天見!